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摘 要 : 近年 来 社交 网 络 的 发 展 推动 了 多 个 领域 的 研究 ， 如 和 与 情 监控 、 广 告 推 荐 、 意 见 领袖 识 别 等 ， 而 社交 网 络 用 

0 以 新 浪 微 博 为 研究 对 象 ， 则 在 提出 一 种 适用 性 更 广 、 考 虑 因素 更 全 面 的 微 博 
影响 力度 量 算法 ， 将 用 户 基本 属性 、 用 户 交互 行为 和 用 户 博文 内 容 三 个 维度 因素 融入 传统 PageRank 算法 中 ， 

了 一 种 多 维度 微 博 用 户 影响 力度 量 算法 MDIR(multi-dimension influence rank)。 实 验 结 果 表 明 ，MDIR 算法 

相 较 于 其 他 常用 的 五 种 影响 力度 量 算法 ， 能 更 加 全 面 、 真 实地 反映 微 博 用 户 的 实际 影响 力 。 
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Multi-dimensional measure of Microblog user influence based on PageRank 


Luo Fang!, Xu Yangl, Pu Qiumei?, Qiu Qizhi! 
(1. School of Computer Science & Technology, Wuhan University of Technology, WuHan 430063, China; 2. School of 
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Abstract: In recent years, the development of social networks had promoted research in many fields, such as public opinion 
monitoring, advertising recommendation and opinion leader identification etc. The influence measurement of social network 
users ls the basis of the above research. This paper integrated the basic attributes of user, interaction behavior of user and 
user’s microblog content into the PageRank algorithm, therefore, it proposed a multi-dimensional user influence 
measurement algorithm:MDIR(multi-dimension influence rank). The experiment shows that, the MDIR can reflect the 
actual influence of microblog users more comprehensively and realistically than other five commonly used influence 
measurement algorithms. 
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0 引言 监控 过 程 中 需要 对 某 些 高 影响 力 的 用 户 采 取 特 别 措施 ， 以 免 
二 与 情 泛滥 ， 对 于 广告 投放 而 言 ， 选 取 高 影响 力 的 用 户 作为 初 

随 着 互联 网 技术 的 迅速 发 展 ， 以 博客 技术 为 代表 ， 围 绕 始 的 广告 传播 的 中 心 可 以 使 得 传播 效果 最 大 化 ， 对 于 用 户 推 

用 户 互 动 与 个 性 体验 的 互联 网 应 用 技术 进一步 推动 了 以 开放 、 ” 荐 而 言 ， 用 户 感 兴趣 领域 的 “意见 领袖 ”中 常常 都 是 默认 推荐 
共享 为 特征 的 Web 2.0 时 代 向 具有 信息 融合 特征 的 Web 3.0 ”的 对 象 。 综 上 所 述 ， 用 户 影响 力 的 度量 在 当前 的 热点 研究 中 
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时 代 过 渡 。 微 博 是 微型 博客 的 简称 ， 是 一 种 基于 关注 机 制 分 扮演 着 不 可 忽视 的 角色 。 

享 简短 实时 信息 的 广播 式 的 社交 网 络 平台 。 据 CNNIC 发 为 了 合理 地 度量 微 博 用 户 的 影响 力 ， 本 文 在 PageRank 
布 的 第 41 次 《中 国 互联 网 络 发 展 状况 统计 报告 》 中 的 数据 显 算法 的 基础 上 进行 改进 ， 并 提出 了 MDIR (multi-dimension 
示 出 ， 截 至 2017 年 12 月 ， 我 国 微 博 用 户 规模 为 3.76 亿 ， 推 influence rank) 算法 ， 相 比较 于 其 他 影响 力度 量 算法 而 言 ， 
动用 户 使 用 率 持续 增长 达到 40.9%, 较 2016 年 12 月 上 升 3.8 ”MDIR 算法 考虑 的 影响 因素 更 为 全 面 、 合 理 ， 其 得 到 的 用 户 


个 百分点 。 微 博 平 台中 每 个 用 户 除 了 发 布 自己 原创 的 微 博 信 影响 力 排 名 也 更 为 客观 。 
息 外 , 还 可 以 随意 的 转发 、 评论、 点 赞 其 他 用 户 的 微 博信 息 ， 

不 同 用 户 之 间 的 相互 转发 、 评 论 、 点 赞 等 行为 促成 了 微 博 信 1 ”相关 工作 

息 传播 网 络 的 形成 。 另 外 ， 微 博 平 台 还 具有 用 户 使 用 门槛 较 前 ， 国 内 外 学 者 对 于 社交 网 络 用 户 影响 力度 量 的 研究 
低 、 微 博 内 容 短小 精 悍 、 可 阅读 性 强 的 特点 ， 这 些 特点 使 得 ”一 般 基 于 用 户 的 基本 属性 、 交 互 行为 以 及 发 布 的 博文 内 容 三 
微 博信 息 的 传播 速度 更 快 以 及 影响 范围 更 广 。 个 方面 : 

微 博 用 户 的 影响 力 可 以 理解 成 是 某 用 户 发 布 微 博 后 引起 a) 基于 用 户 基本 属性 的 影响 力度 量 方法 。 
其 他 用 户 行为 改变 的 能 力 。 在 微 博信 息 传播 的 过 程 中 ， 不 同 户 的 基本 属性 是 用 户 影响 力 最 原始 的 体现 ， 常 见 的 基 
影响 力 的 用 户 对 微 博信 息 的 操作 《如 转发 、 评 论 等 ) 和 态度 ”本 属性 如 粉丝 数 、 发 博 数 等 ， 这 些 大 多 都 是 当前 流行 的 影 
(如 支持 、 反 对 等 ), 会 对 微 博信 息 的 传播 范围 与 传播 深度 产 力度 量 算法 所 考虑 的 特征 因素 。Cha 等 人 选取 Twitter 
生 不 同 的 影响 。 用 户 影 响 力 的 度量 在 网 络 与 情 监 控 、 广 告 投 。 户 的 粉丝 数 、 转 发 数 、 评 论 次 数 三 个 属性 ， 按 节点 度 计算 
放 、 用 户 推荐 等 领域 有 着 重要 的 应 用 。 对 于 与 情 监控 而 言 ， 户 的 影响 力 并 对 比 所 得 结果 的 相关 改 其 实验 结果 表明 用 户 
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录用 定稿 罗芳 ， 等 : 基于 PageRank 的 多 维度 微 博 用 户 影响 力度 量 第 37 卷 第 5 期 
粉丝 数 的 多 少 与 用 户 微 博 被 转发 数 、 被 评论 数 并 不 成 正比 例 传统 的 PageRank 算法 用 于 微 博 用 户 的 影响 力度 量 时 ， 
关系 。Mao 等 人 和 内 对 微 博 用 户 的 活跃 度 进行 了 分 析 ， 但 是 其 ”将 微 博 平台 中 的 用 户 类 比 为 Web 网 络 中 的 网 页 , 仅仅 考虑 了 
仅仅 只 通过 评论 数 进行 分 析 ， 并 没有 分 析 其 他 因素 ， 也 没有 用 户 与 用 户 之 间 的 关注 与 被 关注 关系 。 若 直接 采用 PageRank 
排除 微 博 平台 中 “僵尸 粉 ? 对 用 户 影响 力 的 干扰 。 算法 度量 用 户 影响 力 会 存在 以 下 问题 : 

b) 基于 用 户 交 互 行为 的 影响 力度 量 方法 。 a) 初始 PR 值 的 确定 不 够 客观 。 

用 户 间 的 交互 行为 是 用 户 影 响 力 的 直接 体现 ， 常 见 的 用 PageRank 算法 对 于 网 页 的 初始 PR 值 采 取 的 计算 方法 是 
户 交 互 行为 有 转发 、 评 论 、 提 及 、 点 赞 等 。 张 吴 等 人 喇 基 于 取 平 均 数 ， 这 样 的 方法 并 不 适用 于 微 博 用 户 影响 力度 量 。 
用 户 的 基本 属性 与 交互 行为 提出 了 UI 算法 ， 其 首先 引出 了 于 每 个 用 户 间 的 差异 (具体 表现 在 用 户 的 粉丝 数 、 发 博 数 、 


“用 户 影响 力 ” 与 “用 户 被 影响 力 ” 的 概念 ，“ 用 户 影响 力 ” 是 否认 证 等 )， 若 直接 采用 取 平 均 数 的 方式 得 到 用 户 的 初始 
是 基于 用 户 的 粉丝 数 、 发 博 数 、 微 博 被 转发 数 等 属性 计算 得 。 PR 值 , 则 会 忽略 用 户 自身 属性 对 微 博 传播 所 带 来 的 影响 ,从 
来 ， 而 “用 户 被 影响 力 ” 则 是 基于 粉丝 用 户 与 关注 用 户 之 间 ”而 导致 最 后 计算 出 的 用 户 影响 力 排 名 不 够 客观 。 


的 交互 情况 ， 如 粉丝 用 户 对 某 关注 用 户 的 微 博 进行 转发 、 评 b) PR 值 的 分 配方 式 不 够 合理 。 
论 的 次 数 占 该 粉丝 用 户 对 其 所 有 关注 用 户 的 微 博 进行 转发 、 网 页 将 自身 PageRank 值 均匀 地 分 给 它 所 链 出 的 网 页 ， 


评论 的 总 数 的 百分比 ， 但 是 作者 对 用 户 各 种 交互 行为 采取 的 ” 这样 的 计算 方式 对 于 微 博 用 户 显 然 不 合理 。 因 为 不 是 所 有 用 
量化 手段 是 归 一 化 ， 这 并 不 符合 实际 微 博 传播 情况 ; 王 顶 等 户 都 能 做 到 对 他 们 关注 的 所 有 用 户 一 视 同仁 ， 大 多 数 用 户 只 
人 多 在 张 吴 等 人 研究 的 基础 上 考虑 了 不 同行 为 的 权重 值 ， 其 ”对 其 中 的 一 部 分 表现 出 兴趣 从 而 愿意 为 其 投入 更 多 的 注意 力 。 


实验 部 分 也 从 数据 出 发 对 排序 结果 作出 了 详细 的 论证 ， 但 是 c) 网 络 结构 的 考虑 不 够 全 面 。 
其 只 基于 用 户 间 的 关注 关系 构建 网 络 拓扑 ， 没 有 考虑 到 微 博 PageRank 算法 在 微 博 中 的 应 用 是 基于 用 户 的 关注 关系 ， 
中 存在 大 量 的 “僵尸 粉 ”， 即 关注 了 某 用 户 之 后 并 不 对 其 产 此 算法 很 大 程度 上 依赖 于 粉丝 数 。 但 由 于 粉丝 中 可 能 包含 


生 交 互 行为 ， 这 类 粉丝 在 微 博 的 传播 中 起 不 到 作用 ;， 孙 红 等 ”很 多 无 效 的 僵尸 粉 与 沉默 粉 ， 所 以 粉丝 数 并 不 能 真实 地 反映 
人 所 综合 考虑 用 户 的 实际 微 博 活动 行为 以 及 微 博 网 络 的 拓扑 ”用 户 的 影响 力 。 此 外 ， 微 博 用 户 是 动态 的 ， 他 们 之 间 存 在 着 
结构 ， 进 而 提出 了 MBUI-Rank 算法 ， 其 实验 结果 表明 该 算 ”各 种 各 样 的 行为 ， 如 转发 微 博 、 评 论 微 博 等 。 这 些 行为 对 用 
法 计算 出 的 用 户 影 响 力 较为 准确 与 客观 ， 齐 超 等 人 由 在 。” 户 微 博 的 传播 有 着 明显 的 推动 作用 ， 而 且 这 些 行为 不 仅仅 发 
PageRank 算法 的 基础 上 加 以 改进 提出 了 BWPR 算法 ,分别 。 生 在 有 关注 关系 的 用 户 之 间 ， 如 新 浪 微 博 推 出 的 “ 微 吧 ”和 
对 转发 、 评 论 、 提 及 三 种 行为 构建 拓扑 网 络 ， 虽 然 该 算法 在 “ 微 话题 ”功能 ， 用 户 不 需 关注 即 可 获取 微 吧 或 微 话题 内 其 


实验 中 得 到 了 很 好 的 效果 ， 但 是 其 只 考虑 了 用 户 交 互 行为 这 ”他 用 户 所 发 的 消息 并 且 可 以 对 其 进行 转发 、 评 论 等 操作 。 
种 显 性 特征 ， 没 有 考虑 隐 性 的 用 户 兴 趣 偏 好 。 2.2 MDIR 影响 力度 量 因素 
c) 基于 博文 内 容 的 影响 力度 量 方法 。 针对 上 文 分 析 的 PageRank 算法 在 度量 用 户 影响 力 时 存 
用 户 所 发 布 的 微 博 携带 着 大 量 信息 ， 通 过 对 博文 内 容 进 ” 在 的 问题 ， 本 文 提 出 的 MDIR 算法 综合 考虑 了 以 下 三 个 维度 
行 分 析 可 以 获取 用 户 所 感 兴趣 的 话题 或 者 用 户 的 情感 属性 ， 的 因素 : 
这 些 特征 也 被 广泛 地 应 用 在 影响 力度 量 的 领域 中 。Weng 等 a) 基于 用 户 基 本 属性 的 影响 因素 。 
人 四 基于 Twitter 数据 提出 了 TwitterRank 算法 ， 其 不 仅 考虑 j 户 自身 的 基本 属性 如 用 户 的 粉丝 数 、 发 博 数 、 认 证 情 
网 络 结构 ， 而 且 基 于 推 文 内 容 分 析 了 每 个 用 户 所 发 推 文 的 话 。 ” 况 。 用 户 的 粉丝 数 、 发 博 数 对 于 用 户 的 影响 力 而 言 是 一 个 比 


题 相似 性 ， 最 后 将 用 户 在 每 个 主题 中 的 影响 力 值 求 和 得 到 用 较 直 观 的 影响 因素 。 通 常 来 讲 ， 用 户 的 粉丝 数 越 多 ， 意 味 着 
户 在 整个 网 络 中 的 影响 力 值 。 虽 然 此 方法 在 实验 中 得 到 了 不 能 看 到 该 用 户 发 布 的 微 博信 息 的 用 户 也 越 多 ， 从 而 导致 该 用 
错 的 效果 ， 但 是 其 也 只 考虑 了 推 文 数目 和 话题 相似 度 ， 和 忽略 户 所 能 影响 到 的 人 数 也 越 多 ; 如 果 说 用 户 的 粉丝 数 决 定 了 该 
了 用 户 之 间 的 交互 行为 特征 。 师 亚 凯 等 人 [9 通过 引入 网 络 拓 用 户 影响 力 的 范围 ， 那 么 用 户 的 发 博 数 则 决定 了 该 用 户 影 响 
扑 结构 中 用 户 行为 与 基于 博文 内 容 的 用 户 兴 趣 相 似 度 来 衡量 力 的 深度 。 对 于 相同 规模 的 粉丝 群体 ， 用 户 的 发 博 数 越 多 ， 
用 户 间 的 影响 力 ， 但 是 没有 考虑 用 户 的 粉丝 数 、 认 证 情况 等 则 每 个 粉丝 被 该 用 户 微 博信 息 所 影响 到 的 次 数 也 会 随 之 增多 ， 
用 户 基本 属性 。 即 该 用 户 影响 力 的 深度 越 深 ; 用 户 的 认证 情况 对 用 户 的 影响 
鉴于 当前 研究 的 不 足 之 处 ， 本 文 在 PageRank 算法 的 基 力 而 言 是 一 个 潜在 的 影响 因素 , 如果 用 户 通过 新 浪 微 博 认 证 ， 
础 上 进行 改进 ， 提 出 了 一 种 融合 用 户 基本 属性 、 用 户 交 互 行 则 其 微 博 的 可 信 度 越 高 ， 从 而 使 得 该 微 博 被 评论 和 被 转发 的 
为 、 用 户 博 文 内 容 的 多 维度 微 博 用 户 影响 力度 量 算法 可 能 性 越 大 ， 因 此 用 户 景 
——MDIR (multi-dimensionin fluence rank)。 b) 基于 用 户 间 交互 行为 的 影响 因素 。 
在 微 博 平台 中 ， 用 户 所 发 布 、 转 发 的 微 博 都 以 潜移默化 
2 ”MDIR 算法 基本 原理 的 方式 影响 着 他 们 的 粉丝 ， 而 粉丝 的 评论 、 转 发 、 提 及 等 行 
2.1 PageRank 算法 为 则 又 反 过 来 推动 微 博信 息 的 传播 。 微 博信 息 被 转发 的 次 数 
PageRank 算法 是 互联 网 中 广泛 用 于 网 页 排名 的 经 典 算 越 多 ， 意 味 着 该 微 博 信息 被 传播 得 越 广 ; 微 博 信息 被 评论 的 
法 上 00， 其 核心 思想 是 研究 网 络 的 拓扑 结构 并 计算 页 面 中 的 入 次 数 越 多 ， 意 味 着 该 微 博 信息 受 关注 度 越 高 ， 用 户 被 提 及 次 


链 数 〔( 即 页 面 链接 的 次 数 )， 从 而 确定 该 页 面 的 排名 顺序 。 数 越 多 ， 说 明 该 名 用 户 在 其 粉丝 群体 中 建立 的 威信 和 度 越 高 。 
PageRank 算法 的 相关 公式 如 式 〈1) 所 示 。 其 中 : PR(p) 为 c) 基于 用 户 博文 内 容 的 影响 因素 。 

页 面 p; 的 PageRank 值 ; 1(p;) 为 页 面 疡 的 入 链 集合 ; 10(p7)| 为 户 发 布 与 转发 的 微 博 信息 可 以 看 做 是 用 户 个 人 兴趣 的 

页 面 ?; 的 出 链 集合 中 网 页 的 数量 ，d 是 阻尼 系数 ， 通 常 采 用 体现， 通过 对 博文 内 容 的 挖掘 可 以 得 到 每 条 微 博 的 主题 分 布 

d = 0.8502]。 向 量 ， 而 综合 一 个 用 户 所 有 微 博 的 主题 分 布 向 量 ， 可 以 得 到 

PR(p)=(-d)+d TD Bd 0 代表 一 个 用 广 兴趣 的 主题 分 布 癌 基 ， 本 文 简称 为 兴趣 分 布 向 

nt [0(p))| 量 。Weng 等 人 四 指出 ， 在 Twitter 中 用 户 感 兴趣 的 话题 越 相 
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似 ， 则 他 们 相互 关注 的 可 能 性 越 大 。 虽 然 其 在 Twitter 平台 下 
做 的 实验 , 但 由 于 Twitter 与 微 博 的 结构 具有 相似 性 ， 其 结果 
也 可 以 被 用 于 微 博 平台 。 李 志 宏 等 人 [3] 指 出 微 博 用 户 间 具 
“同好 性 ”, 即 用 户 更 倾向 于 与 自己 有 相同 兴趣 爱好 的 用 户 建 
立 关系 (转发 关系 、 评 论 关系 等 )。 

综 上 所 述 ,本 文 提 出 的 MDIR 算法 基于 用 户 的 基本 属性 ， 
计算 出 用 户 的 初始 影响 力 值 ， 解 决 了 传统 PageRank 算法 的 
不 够 客观 的 缺点 ; 基于 用 户 间 的 交互 行为 与 用 户 博 文 内 容 ， 
计算 用 户 间 的 传播 意愿 ， 从 而 改进 了 传统 PageRank 的 影响 
力 均值 分 配 的 问题 ;基于 用 户 的 交互 行为 ， 构 建 用 户 微 博信 
息 的 传播 网 络 ， 有 效 地 排除 了 大 量 “ 僵 尸 粉 ”沉默 粉 ” 对 用 
户 影响 力 的 干扰 。 


3 ”MDIR 算法 具体 实现 
3.1 微 博 传播 网 络 的 构建 


A 


根据 2.2 节 所 述 ， 本 文通 过 用 户 的 转发 、 评 论 、 提 及 行 
为 构建 一 个 微 博信 息 的 传播 网 络 简称 微 博 传播 网 络 ， 其 定义 


如 下 : 
定义 1 微 博 传播 网 络 。 设 微 博 传 播 网 络 为 G=(V,，E, 8B)， 

其 中 V=8 中 =42,3,…,n} 为 微 博 传 播 网 络 中 节点 的 集合 , vi 代表 
有 涉及 到 转发 、 评 论 、 提 及 三 种 行为 中 一 种 或 多 种 的 微 博 用 
户 ; ={QVi,v))B,vj eV,iz jviRvj VviCvj vvMvj} 为 微 博 传播 网 络 
中 边 的 集合 ，wRvw 代表 用 户 ”转发 过 用 户 六 的 微 博 ，wCcv 代 
表 用 户 v 评 论 过 用 户 v 的 微 博 ，wwvw 代表 用 户 六 在 微 博 中 提 
及 过 用 户 Yv; 8={Bj|(,vj)eE} 为 微 博 传播 网 络 中 边 权 集合 ， 
8B;; 代表 用 户 六 对 用 户 六 的 转发 、 评 论 、 提 及 次 数 的 带 权 之 
和 。 


三 种 行为 对 微 博 的 传播 有 着 不 同 的 贡献 比例 ， 所 以 8， 
应 该 综合 考虑 每 种 行为 的 贡献 比例 。 本 文 用 a、B、y 分 另 | 表示 


转发 、 评 论 、 提 及 三 种 行为 的 贡献 比例 ， 其 公式 如 式 (2) 所 
示 。 

Bj;=0R +DC + (2) 
EF 中; Ri 、 Ci Mi; ) 为 用 吕 Vi 对 用 户 ， 的 转发 、 评论 、 提 


及 次 数 。 对 于 a、 PY 的 取 值 本 文 根 据 序 关系 法 确定 , 首先 将 
各 个 变量 的 重要 程度 做 成 对 比较 ， 然 后 将 比较 的 结果 按 一 定 
的 方式 聚合 起 来 ,最 终 经 过 计算 得 到 w 及 > 的 值 . 对 人 及 7 
构建 一 个 判断 矩阵 4， 如 式 〈3 ) 所 示 。 
a an a Qa/la oa/lpB aly 
dy dy 2 BIB 7 (3) 
rig YIB Y/Y 
矩阵 4 中 的 元 素 % 代表 第 i 个 变量 对 第 j 个 变量 的 相对 
重要 性 , 在 矩阵 4 中 元 素 的 性 质 有 ;=1/aj 
接着 根据 Saaty 等 人 总 结 出 的 变量 间 相 对 重要 性 等 级 表 09 
( 表 1) 结合 三 种 行为 的 相对 重要 关系 可 以 对 和 矩阵 4 中 的 元 
素 赋值 。 其 中 ， 转 发 行为 与 评论 行为 相 比 处 于 略微 重要 到 相 
重要 之 间 ， 故 取 wm =4 。 转 发 行为 同 提 及 行为 相 比 ， 处 于 
明显 重要 与 绝对 重要 之 间 ， 故 取 ws =8 。 评 论 关 系 和 提 及 关 


泣 三 


(31 U3 U33 


' 


系 相 比 ， 处 于 同等 重要 与 略微 重要 之 间 ， 故 取 ws=2 。 将 
a aa as 代入 到 式 (3) 中 ， 得 到 的 最 终 和 矩阵 如 式 (4) 所 示 。 
1 4 8 
os 1 :| (4) 
0.125 0.5 1 
联 立 方程 组 ， 最 后 a、B、Y 的 值 如 式 (5) 所 示 。 
0&=0.727 
ow (5) 
7=0.091 
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表 1 变量 之 间 的 相对 重要 性 


Table 1 Relative Importance between variables 


相对 重要 程度 。 定义 说 明 
1 同等 重要 两 个 变量 同样 重要 
3 略微 重要 个 变量 比 另 一 个 变量 稍微 重 如 
相当 重要 个 变量 比 另 一 个 变量 更 为 重要 
5 明显 重要 一 个 变量 比 另 一 个 变量 更 为 重要 ， 
且 已 有 实践 证 日 
9 绝对 重要 重要 程度 可 以 肯 


有 
定 
2, 4, 6, 8 两 个 相 邻 判断 的 中 间 值 需要 折 中 时 采 


= 六 2 
~ A =a dy =。 


3.2 初始 影响 力 计算 

本 文 从 用 户 的 粉丝 数 、 发 博 数 、 认 证 情况 三 个 基本 属性 
入 手 计算 用 户 的 初始 影响 力 值 ,由 于 不 同 用 户 之 间 的 粉丝 数 、 
发 博 数 差异 巨大 ， 本 文采 用 一 种 对 数 归 一 化 的 方法 对 用 户 的 
粉丝 数 、 微 博 数 进行 处 理 ， 降 低 数据 的 跨度 。 计 算 公 式 如 式 
(6) 所 示 。 


InitInfi(v;) 


lg (NF (v, lg (NW(y, 
OIL 
其 中 :MG) 代表 用 户 v 的 真实 粉丝 数 ， 即 用 户 * 在 微 博 传 
播 网 络 中 的 入 度 ; NF 代表 真实 粉丝 数 最 多 的 用 户 的 真实 粉 
丝 数 ;NW(v) 代表 用 户 v 的 发 博 数 ， NW 代表 发 博 数 最 多 
的 用 户 的 发 博 数 ;Verip(v) 代表 用 户 vi 的 认证 情况 , Lappas T 
等 人 05 指 出 ， 当 用 户 * 得 到 了 微 博 认证 时 Verijp(v)=0.5， 否 
则 Verip(v)=0 的 取 值 最 为 合适 。 
3.3 MDIR 算法 
MDIR 算法 通过 合理 的 策略 习 
力 ， 其 计算 公式 如 式 (7) 所 示 。 


MDIR(v)=(1-d)+d > ratio(vj,v;)*MDIR(v,) 07) 
vein(vi) 


th 


新 计算 了 目标 用 户 的 影响 


其 中 :in(w) 代表 用 户 vv 在 微 博 传 播 网 络 中 的 入 集合 ; d 是 
阻尼 系数 ， 取 值 一 般 为 0.85; ratiotw,,v) 代表 用 户 v 对 用 户 » 


的 影响 力 贡献 比例 ， 其 计算 公式 如 式 8) 所 示 。 
,a Wn) 
0 CN (8) 


其 中 : outw) 为 用 户 v 在 微 博 传 播 网 络 中 的 出 度 集合 ; 
WQjsv) 代表 用 户 v 对 用 户 v 的 微 博 的 传播 意愿 ， 由 六 对 六 
的 交互 频率 BF(v,w ) 与 兴趣 相似 度 SIM( vw,vi ) 的 乘积 表示 。 
对 于 用 户 间 的 交互 频率 ， 可 以 由 微 博 传播 网 络 G 的 边 权 


集合 8 计算 得 出 ， 如 式 〈9) 所 示 。 
BF (v,,v,) 名 
Vj)= 9 
2 ) 


对 于 用 户 间 兴趣 相似 度 ， 本 文采 用 LDA 模型 抽取 用 户 
的 主题 分 布 向 量 ， 而 后 再 基于 微 博 传 播 网 络 计算 相 邻 用 户 间 
的 相似 度 。 首 先 将 用 户 发 布 、 转 发 、 评 论 过 的 历史 微 博信 息 
聚合 成 一 篇 文档 , 再 将 “文档 一 用 户 ” 集 合作 为 模型 的 输入 ， 
最 后 利用 LDA 模型 输出 每 一 个 用 户 所 对 应 的 主题 分 布 向 量 。 
所 有 用 户 的 主题 分 布 向 量 集合 记 做 矩阵 D7， 其 中 D、T 分 
别 对 应 用 户 数 和 主题 数 , 矩阵 元 素 DT 代表 用 户 vi 在 话题 1 
上 的 概率 。 
基于 “用 户 一 主题 ”和 矩阵 DT, 本 文采 用 KL 距离 计算 用 
户 间 相似 性 ，KL 距离 是 描述 两 个 概率 分 布 P、Q 差异 的 一 种 
方法 ， 其 计算 公式 如 式 〈10) 所 示 。 

P(x) 


KL(P|IQO)= > P(x)In G0 (10) 
根据 式 (10) 可 以 看 出 ， 两 概率 分 布 之 间 越 相似 则 它们 
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的 KL 离散 度 越 小 ， 且 KL 离散 度 不 具有 对 


称 性 ， 即 


KL(PI|Q)z#KL(QIIP) 。 由 此 ， 为 了 更 适当 


电表 示 微 博 用 户 间 的 


相似 度 , 本 文 先 对 KL 距离 取 平 均 而 后 再 取 倒 数 , 如 式 (11) 


所 示 。 
2 


SIM (vv,) = 
Wi) DT DD) RADT MDT) 


(11) 


= 网 


户 v 与 用 户 v 的 话题 分 布 向 量 。 
以 下 是 MDIR 算法 的 主要 处 理 过 程 : 
输入 : 微 博 传播 网 网 络 G=(V,E,B) ， 阻 尼 系 数 d， 阔 值 
输出 : 所 有 用 户 的 影响 力 集 合 5。 
// 微 博 传 播 网 络 边 权 值 初始 化 
for B.;eB 
Bj;=0R ;+PBC; +yM;,; 


// 用 户 vi 的 影响 力 值 初始 化 


for veV 


1 
2 
3 
4 end for 
5 
6 


MDIR (v,) ls (NF (%)) ,ls (NW(%)) +Werify (v;) 
© lg(NFa) lg(NWia) | 


8 end for 

9 S.Init() // 初 始 化 集合 S 
18 // 用 户 影响 力 计算 ， 当 所 有 
11 while |s| < |v| 

12 while (vj,v) eE 


13 =MDIR(v)// 用 户 v; 上 一 轮 计算 的 影响 力 值 
B, 
BFv)= 去 -一 一 
14 a 
Dt Bt 
2 


15 SIM(v,,v;) 


KL(DT. ||DT,)¥ KL(DT, ||DT.)? 


W(vj,v;) 
ratio(v;,v; )= hed 
16 (vv) ee Ws) 


out(vj 


17 MDIR(v)=(1-d)+d > ratio(v,,v)*MDIR(Y,) 
vein(vi) 


1 


oo 


P= MDIR(v,) // 
19 if | P-R| <s 
26 S.add(v,P ) 

21 end if 

2 
2 
24 return S 


户 vi 当前 轮 次 计算 的 影响 力 值 


\D 


© 


// 保 存 


户 v 的 影响 力 


Dh 


end while 


Wu 


end while 


中 : DT 与 DT 分 别 为 矩阵 DT 的 第 i 行 与 第 j 行 ， 表 示 用 


8 。 


户 的 影响 力 值 都 收敛 时 ， 和 迭代 结束 


根据 式 〈8) 可 以 构造 概率 转移 矩阵 M， 从 而 MDIR 算 


收敛 条 件 有 : 
阵 ; c) 矩阵 M 为 非 周 
可 直接 满足 收敛 条 件 a) 和 b); 
开始 前 会 对 用 户 进行 筛选， 


提出 的 MDIR 算法 是 可 收敛 的 。 
4 ”实验 结果 与 分 析 


4.1 数据 集 与 实验 环境 
4.1.1 数据 集 选取 

本 文 以 新 浪 微 博 为 作为 数据 源 , 礁 取 了 2014 缠 
浪 微 博 一 个 月 内 12 个 热门 话题 下 的 部 分 


法 的 求解 过 程 可 以 转换 成 一 个 Markov 过 程 。Markov 过 程 的 
a) 矩阵 MM 为 随机 符 阵 ，b) 矩阵 4 为 不 可 约 矩 
期 矩阵 。 根 据 式 (8) 的 表述 ， 和 矩阵 MX 
对 于 收敛 条 件 c)， 本 文 在 实验 
舍得 构建 的 微 博 传播 网 络 是 一 个 
虽 连 通 图 ， 可 以 保证 矩阵 M 的 不 可 约 性 。 综 上 所 述 ， 本 文 所 


FE5 月 份 新 


户 微 博信 息 作为 


研究 数据 。 由 于 仆 取 到 的 用 户 信息 繁杂 、 元 余 信息 过 多 ， 本 
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文 过 滤 掉 发 博 数 少 于 10、 关 注 用 


户 数 少 于 10 的 
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~ A 
j 户 ， 由 入 


选 后 的 数据 所 构建 的 微 博 传播 网 络 的 相关 数据 如 表 2 所 示 。 


表 2 微 博 传播 网 络 相关 数据 


Table 2 Related data of microblog propagation network 


信息 数据 
总 节点 数 81346 
总 边 数 2712345 
平均 出 度数 18.37 
平均 入 度数 17.12 
总 微 博 数 1091461 


4.1.2 实验 环境 


费 的 时 间 开 销 较 大 ， 


于 在 构建 微 博 传 播 网 络 与 MDIR 算法 迭代 计算 时 所 耗 
本 文 对 这 两 个 过 程 进行 了 基于 
MapReduce 的 并 行 化 设计 。 实 验 使 用 四 台 PC 机 搭建 Hadoop 


集群 ， 每 台 机 器 的 操作 系统 均 为 64 位 CentOS-7。 具 体 集群 
概况 如 表 3 所 示 。 
表 3 实验 集群 概况 
Table 3 Overview of experimental clusters 
IP 地 址 主机 名 集群 角色 
NameNode 
172.168.21.5 Master SecondNameNode 
ResourceManager 
172.168.21.6 Slave01 DataNode 
172.168.21.7 Slave02 DataNode 
172.168.21.8 Slave03 NodeManager 


4.2 对比 实验 与 评价 标准 
4.2.1 对 比 实 验 


为 了 让 实验 结果 更 有 说 服 力 ， 本 文选 取 了 目前 较为 流行 
或 经 典 的 用 户 影响 力度 量 算法 作为 对 比 实验 。 首 先 选取 的 是 


PageRank 算法 ， 由 于 MDIR 算法 是 基于 


法 ,上 


原始 的 PageRank 算法 做 对 比 更 会 凸显 该 算法 的 优点 ; 


PageRank 的 改进 算 


其 次 选取 的 是 BWPR 算法 ， 齐 超 等 人 [9 基于 PageRank 算法 


提出 了 一 种 BWPR 算法 计算 用 户 影响 力 , 其 主要 改进 是 基于 
用 户 间 交互 行为 来 确定 粉丝 用 户 影响 力 的 分 配 因子 ;然后 是 


TwitterRank 算法 ，Weng 


等 人 外 提出 了 针对 Twitter 平台 的 


TwitterRank 算法 ， 该 算法 主要 是 在 PageRank 算法 的 基础 上 
融合 了 用 户 的 兴趣 相似 度 , 虽然 该 算法 是 基于 Twitter 平台 的 ， 
但 是 Twitter 平台 与 新 浪 微 博 平台 在 结构 上 是 一 脉 相 承 的 , 所 


以 将 TwitterRank 算法 推广 在 微 博 平台 也 


具有 一 定 意义 ;最 后 


两 种 分 别 是 基于 用 户 粉丝 数 与 发 博 数 的 排名 算法 。 


4.2.2 评价 标准 


以 给 


在 实际 环境 中 微 博 用 户 影响 力 的 衡量 标准 众多 ， 难 
定 一 个 统一 标准 。 本 文采 用 丁 兆 云 等 人 09 提 出 的 M 折 交 叉 
验证 的 方法 ， 分 别 验证 了 算法 的 准确 率 、 


召回 率 和 下 值 。 首 


先 求 出 实验 中 的 五 种 排序 算法 与 本 文 提 


的 MDIR 算法 各 


所 计算 出 的 Top-K 影响 力 用 户 集合 友 ， 


然后 构造 标准 排序 集 


合 1x 为 任意 M (1<M <6) 种 算法 都 投票 为 正确 的 结果 。 集 合 


Iu 的 算术 描述 如 式 (12〉 所 示 。 


M 
m= WY 
xeCombine(6,M) \ = 


其 中 :Compbine(6,M) 是 从 六 种 算法 中 选取 


例如 ， 给 定 四 种 算法 A、B、C、D 得 到 的 Top-K 个 影响 力 用 


(12) 
MM 种 算法 的 组 合 数 。 


户 集 合 为 4H、1s、Ic、1p， 假 设 M=2， 则 标准 集合 zw 的 构成 


如 式 (13) 所 示 。 


Tu =(14 M1s) UL MI)UG N15)U 


(Ts NT)U(Ts NN UUeN 


2 (13) 
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中 : 算法 A 的 准确 率 P4 的 计算 公式 如 式 〈14) 所 示 。 


a 0 
算法 A 的 召回 率 R4 的 计算 公式 如 式 (15)〉 所 示 。 
_|a Ml 
Ro (15) 
算法 A 的 瑟 值 的 计算 公式 如 式 (16)〉 所 示 。 
* LR 
Ft,=2 PR (16) 


4.3 算法 有 效 性 验证 


由 


同时 对 六 种 算法 如 


于 M>5 时 ， 标 准 和 


到 


7 是 


M={2,3,4} 的 情况 下 进行 交叉 验证 。 
合 内 的 元 素 较 少 ， 各 算法 的 准确 率 与 


召回 率 比 较 相 似 ， 故 予以 忽略 。 针 对 M=2、3、4 的 三 种 情况 


4.3.1 准确 率 验 证 


在 用 户 规模 为 Top-K 的 情况 下 ， 准 确 率 表示 
确 计 算出 的 Top-K 用 户 的 个 数 与 用 
示 的 三 组 实验 结果 表明 ，MDIR 算法 在 不 同 的 用 
交叉 折 数 M 下 的 准确 率 都 优 于 其 他 对 比 算法 。 
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标 算 法 正 


户 数 玉 的 比值 。 由 图 1 所 


4 时 ， 集 合 必 中 的 


ps 


标准 集 的 相交 的 元 素 也 较 少 ， 故 整体 的 交 


的 时 候 要 低 一 些 。 
4.3.2 召回 率 验 证 


在 规模 为 Top-K 影响 力 用 


j 户 较 少 ， 


户 规模 与 
其 中 当 M=3、 


从 而 使 得 任意 算法 的 结果 集 与 


E 确 率 相 较 于 M=2 


户 中 ， 召 区 


率 为 


标 算法 “下 


确 ” 计 算出 的 Top-K 用 户 的 个 数 与 标准 集中 影响 力 用 户 个 数 


的 比值 ， 反 映 了 微 博 中 影响 力 用 
分 别 在 M=2、3、4 的 情况 下 Top-K 影 
布 如 图 2 所 示 。 实 验 表 明 ， 


对 六 种 算法 所 得 的 Top-K (分 别 值 取 100、200、...、1000) 
影响 力 用 户 的 准确 率 、 召 回 率 及 下 值 进行 比较 ， 实 验 结果 表 
明 MDIR 算法 在 三 种 衡量 指标 下 都 有 不 错 效果 。 


100 200 300 400 500 600 700 800 900 1000 


Top-k 用 户 
{a)jM =2 


S -一 大 
-好 一 -一 
一 6 一 一 多 一 


~ 


100 200 300 400 500 500 700 800 900 1000 


Top-K 用 户 
(c)M = 4 


图 1 


Fig. 1 


人 

0 ao 0 son soo 700 soo ooo o 
Top-k 用 户 
(ajM = 2 

ba ba ba ba ba ba 合 全 全 二 


Top-K 用 户 
(c}M = 4 


显 。 因 为 召 下 


户 被 发 现 上 


Waiy 


的 程度 。 六 种 算法 


力 ) 


户 的 召回 率 分 


MDIR 算法 在 M 下 


两 者 都 随 之 增加 ， 召 回 率 变化 不 明显 。 


0.7 
讨 0.6 
i 
0.4 六 一 全 一 一 六 
0.3 /由 ee 
0.2 pA 
Top-K 用 户 
(b)M = 3 
一 一 MDIR 
BWPR 
一 一 PageRank 


一 一 TWitterRank 
发 博 数 排名 
一 -粉丝 数 拌 名 


各 算法 在 交叉 验证 中 的 准确 率 


Precision of algorithms in cross-validation 


区 | oy 
苞 
RO 。%s 有 
隐 > 
0.4 pa 人 六 = 
Top-K 用 户 
(bjM =3 
一 一 MDIR 
BWPR 


——PageRank 

一 一 TwitterRank 
发 博 数 排名 

一 -粉丝 数 拌 名 


图 2 各 算法 在 交叉 验证 中 的 召回 率 


Fig.2 Recall of algorithms in cross-validation 


的 三 种 取 值 下 均 
有 不 错 的 表现 ， 在 M=3 的 情况 下 MDIR 算法 区 分 度 尤为 明 
率 由 Iaxl 和 | 共同 决定 ,所 以 当 M 增加 时 
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4.3.3 下 值 验证 不 佳 ， PageRank 算法 和 用 户 粉丝 数 排名 的 变化 趋势 很 相近 ， 

F 值 综合 考虑 召回 率 与 准确 率 ， 反 映 算 法 整体 召回 率 与 。 足以 说 明 PageRank 很 大 程度 依赖 于 用 户 的 粉丝 数 ， 这 也 是 
准确 率 的 程度 。 各 算法 在 交叉 验证 中 的 了 值 如 图 3 所 示 。 原始 PageRank 算法 的 局 限 所 在 ， 用户 发 博 数 的 排名 与 用 户 
图 3 可 知 ， 本 文 提 出 的 MDIR 算法 在 三 组 实验 中 有 着 明显 的 。 粉丝 数 排名 由 于 考虑 因素 的 单一 ， 致 使 整体 性 能 很 差 ， 而 本 
优势 ; 同时 可 以 看 出 只 基于 用 户 交 互 行为 的 BWPR 算法 在 统 。 文 提 出 的 MDIR 算法 则 综合 考虑 了 用 户 自身 基本 属性 、 用 户 
计 规 模 增加 的 情况 下 效率 有 所 下 降 ， 这 是 因为 用 户 的 影响 力 。 间 的 交互 行为 以 及 博文 内 容 三 个 维度 的 因素 ， 并 且 有 和 针对 性 
还 与 用 户 的 基本 属性 与 博文 内 容 有 关 ; 基于 用 户 博 文 相似 度 ”地 将 其 融入 原始 的 PageRank 算法 ， 使 得 其 最 终 计算 的 结果 
的 TwitterRank 算法 效率 虽然 会 随 着 统计 规模 的 增加 出 现 上 在 准确 率 、 召 回 率 、F 值 上 均 优 于 其 他 对 比 算法 。 


升 的 趋势 ， 但 是 其 没有 结合 用 户 的 交互 行为 ， 所 以 效率 一 直 
D.9 
一 人 
本 一 
7 Oe 0.6 Re 
- - 人 
1 一 全 一 一 
| i 志 人 全 人 人 
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[1 
> ina 一 -MDIR 
0D.7 
os pe BWPR 
A 


——PageRank 


一 一 TWitterRank 


名 


3 各 算法 在 交叉 验证 中 的 F 值 


Fig. 3 下 -Measure of algorithms in cross-validation 


4.3.4 收 敏 性 验证 的 1 万 条 用 户 数据 时 , 所 花 时 间 为 10 min, 略 低 于 串 行 MDIR 
SF-UIR 算法 是 王 顶 [9 等 人 于 2018 年 提出 的 微 博 用 户 影 ” 算法 所 消耗 的 7 min。 然 而 从 3 万 条 用 户 数据 开始 ， 并 行 化 
响 力度 量 算法 ， 该 算法 在 PageRank 的 基础 上 加 入 了 用 户 自 “MDIR 算法 的 执行 时 间 的 变化 较为 平稳 ， 但 是 串 行 MDIR 算 
身 行为 的 特征 与 网 络 拓扑 结构 中 的 粉丝 用 户 特征 ， 解 决 了 传 ”法 几乎 呈 指 数 型 增长 。 当 达到 的 8 万 用 户 的 数据 规模 时 ， 并 
统 PageRank 算法 客观 性 差 、 影 响 力 传递 比例 分 配 均匀 的 缺 ，” 行 化 算法 所 需 的 时 间 几 乎 为 串 行 算法 的 一 半 。 如 果 数 据 量 持 
点 ， 并 且 通 过 实验 验证 了 该 算法 计算 出 的 影响 力 排序 结果 的 。” 续 增 大 ， 那 么 串 行 算法 会 因为 消耗 的 内 存 过 多 ， 引 起 程序 的 
全 面 性 与 真实 性 。 为 了 进一步 说 明 本 文 提出 的 MDIR 算法 的 异常 退出 ,而 经 过 并 行 化 后 的 MDIR 算法 依然 会 保持 不 错 的 
适用 性 ， 本 文 将 对 比 两 个 算法 收敛 速度 。 性 能 。 
本 文 仍 用 表 2 中 介绍 的 数据 集 ， 分 别 对 两 种 算法 进行 前 
行 化 ， 在 相同 收敛 阔 值 的 情况 下 计算 用 户 影响 力 值 ， 并 且 跟 70 ” 一 一 单机 串 行 MDIR 算 法 
踪 记 录 计 算 过 程 中 的 迭代 次 数 。 结 果 发 现 ，MDIR 算法 使 影 6 
响 力 值 收 敛 的 选 代 次 数 为 58 次 ， 用 时 34 min。 对 于 SF-UIR a Pe 
算法 而 言 ， 其 迭代 次 数 为 65 次 ， 用 时 39 min。 实 验 结果 说 是 0 
明了 本 文 提出 的 MDIR 算法 有 较 好 的 收敛 性 。 a 
4.4 算法 时 间 效 率 验证 ,0 
根据 3.3 节 中 MDIR 算法 的 相关 介绍 可 以 看 出 ， 由 于 要 
计算 用 户 间 的 影响 力 贡献 比例 ratio&,w) ， 所 以 本 文 提出 的 "or 
MDIR 算法 相 较 于 PageRank 算法 的 时 间 复 杂 度 有 所 增加 。 但 10 20 30 40 50 60 70 80 
ratiolvj,v) 的 计算 简单 ， 仅 涉及 微 博文 本 内 容 与 用 户 交 互 关 系 ， 户 数 /1000 
这 些 因素 都 可 以 在 实验 之 前 的 预 处 理 步 骤 中 提取 得 到 。 另 外 ， 图 4 串 、 并 行 MDIR 算法 时 间 效 率 对 比 
MDIR 算法 可 以 达到 高 影响 力 用 户 的 影响 力 值 更 快 累计 ， 低 Fig.4 Time efficiency comparison of algorithm between serial MDIR 
影响 力 用 户 的 影响 力 值 更 快 趋 于 收敛 的 效果 。 为 了 验证 并 行 and parallel MDIR 
化 之 后 的 MDIR 算法 的 时 间 效 率 ， 本 文 比 较 了 单机 串 行 的 5 ”结束语 
MDIR 算法 与 基于 MapReduce 的 并 行 化 MDIR 算法 在 处 理 相 SI 
同 规模 数据 时 ， 从 读 入 数据 到 最 后 收敛 所 消耗 的 时 间 。 根 据 本 文通 过 分 析 传 统 PageRank 算法 度量 用 户 影 响 力 存 在 
不 同 的 用 户 规模 设计 了 八 次 对 比 测试 ， 其 结果 如 图 4 所 示 。 的 问题 ， 从 三 个 维度 进行 了 有 针对 性 的 特征 选取 ， 进 而 提出 
从 图 中 不 难看 出 ， 基 于 并 行 化 的 MDIR 算法 在 处 理 规模 较 小 了 MDIR 算法 。 相 比 当 前 的 相关 研究 ，MDIR 算法 融入 了 更 


录用 定稿 


多 的 影响 因素 ， 
客观 ， 考 虑 用 户 间 的 交互 行为 与 博文 内 容 使 计 
， 考 虑 网 络 拓 才 
的 结果 。 
中 影响 力 评价 指标 上 取得 了 和 良好 的 效果 。 


理 


水 


影响 力 ， 


罗芳 ， 


其 考虑 用 户 自身 的 基本 属性 使 计算 


寺 果 更 为 
结果 更 为 合 
结构 规避 了 不 必要 的 计算 并 且 获 得 更 有 效 
通过 实验 也 可 以 看 出 ， 本 文 提 出 的 MDIR 算法 在 多 


在 下 一 步 的 研究 中 ， 将 会 首先 考虑 用 户 在 不 同 话题 中 的 


挖掘 在 多 个 话题 中 都 具有 高 影响 力 的 意见 领袖 。 其 


次 ， 微 博 中 大 量 的 “水 军 ” 会 对 计算 结果 产生 一 定 的 干扰 


需要 在 度量 算法 中 加 入 对 微 博 “水 军 ” 的 让 


只 别 技术 ， 使 得 最 终 


的 计算 结果 更 客观 。 
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